Mission terminée ! Vous maîtrisez désormais les briques fondamentales du langage des IA !Pas tout à fait correct ! Essayons de reconstruire cette séquence !Connaissances téléchargées : Tokens et Séquences ... Est-ce que c'est ... ? ... Ou ...
Comment appelons-nous les petites unités que l'IA utilise pour lire ?
Exactement ! Les tokens sont des petites unités comme « pomme », « ing » ou « ? » qui constituent le langage pour une IA.
Comment un ordinateur représente-t-il un token pour pouvoir le comprendre ?
Correct ! Les ordinateurs ne comprennent que les nombres, donc chaque token reçoit son propre numéro d'identification unique.
Si nous avons les tokens pour « ami » et « bateau », comment appelle-t-on le mot « amitié » lorsqu'il est une liste de nombres ?
Parfait ! Une liste ordonnée de numéros de tokens s'appelle une séquence.
Pourquoi l'ordre des tokens dans une séquence compte-t-il tant ?
Exactement ! Les mêmes tokens dans un ordre différent peuvent changer entièrement le sens d'une phrase.
Quel est le nombre maximum de tokens qu'une IA peut traiter en même temps ?
Exactement ! La fenêtre de contexte est la limite de la quantité d'information que l'IA peut « garder en tête » pendant une conversation.
Un seul signe de ponctuation, comme un point (.), peut-il être un token ?
Exactement ! Les tokens peuvent être des mots complets, des parties de mots, ou même des signes de ponctuation. Tout est une brique de construction !
1
Tokenisation et Séquences
EvoClass-AI004Lecture 4
0
🤖 Bip Bop ! Bienvenue, Cadet ! Sélectionnez un sous-thème ci-dessous pour voir comment une IA « lit » grâce à la tokenisation.
Commande de Py-BotEN DIRECT
Bip Bop ! Bonjour, Cadet ! Pour enseigner à une IA à lire, nous devons d'abord découper les mots en petits morceaux « Lego ». Prêt à découvrir comment les ordinateurs transforment les mots en chiffres ?
Progrès du sujet0%
Très bonne choix ! Un token est comme un bloc Lego. Des mots comme « amitié » sont divisés en morceaux plus petits comme « ami » et « bateau ». Même un simple point est un token ! Pour une IA, ces morceaux sont plus faciles à gérer que de longues phrases entières.
1
Sous-thème 1
Qu'est-ce qu'un token ?
Découper le texte en petites unités comme « ami » et « bateau ».
Regardez ça ! Dès que nous avons des tokens, l'IA attribue à chacun un numéro d'identification secret. Ces chiffres forment une « séquence ». Souvenez-vous : l'ordre compte ! « Le chien a mordu l'homme » et « L'homme a mordu le chien » utilisent les mêmes blocs, mais la séquence raconte une histoire totalement différente !
2
Sous-thème 2
La puissance des séquences
Transformer des blocs en une liste mathématique où l'ordre est tout.
Saviez-vous que l'IA dispose d'une « fenêtre de contexte », qui est comme sa taille de main. Elle ne peut tenir qu'un certain nombre de tokens dans sa « mémoire » à la fois avant de commencer à oublier le début !
Saviez-vous ?
L'IA dispose d'une « fenêtre de contexte », qui est comme sa taille de main. Elle ne peut tenir qu'un certain nombre de tokens dans sa « mémoire » à la fois avant de commencer à oublier le début !
Chargement...
⭐⭐⭐

Mission terminée !

Vous êtes un maître des tokens !